网络科学波澜突起,找一找无尺度的“尺度”?
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
无标度网络(又称无尺度网络)理论是网络科学的经典理论之一,任何一个网络科学领域的学者都绕不开它,专业内的学生们更是将其视作金科玉律。以往的主流观点认为,在现实世界的复杂网络结构中,无标度网络具有很强的普适性。然而这个占据统治地位的理论近期却遭遇了前所未有的挑战。来自科罗拉多大学的Anna Brodio和 Aaron Clauset用一篇论文向无标度网络发起了进攻。
随机网络与无标度网络
学者在早期的观察研究中认为,许多复杂网络都具“无标度”的特点。在这些复杂网络结构中,大部分节点只连接着很少的节点,而少数节点连接的节点却数量庞大。如果将网络中所有节点各自连接的节点数整理出来,会发现其分布规律满足幂律(Power Law),因此无法以某一个特征标度来描述该网络。这类满足幂律分布的复杂网络结构被称为无标度(Scale-free)网络。
Fig.1随机网络与无标度网络
网络结构的特征标度可以概括性地描述为:该网络中每个节点连接的其他节点个数的平均值。在随机网络中,两个节点以一定概率连接,尽管这个概率不尽相同,但是它最终会稳定成一个均值,这个均值成为了网络结构中十分重要的参数。节点的连接数分布曲线呈钟形,某点越偏离均值其出现的概率就越小。
这就是无标度网络中“无标度”的由来:幂律分布没有峰值,随着横坐标连接数的增大,纵坐标节点数逐渐减少,并且减少的速率放缓,最终在曲线的尾部留下一个长长的重尾。其现实效果就是,大多数节点的连接数较小,但会产生少量连接数极大的枢纽节点(hub)。
无标度网络理论的“胜利”
以往的主流观点认为,无标度性质在复杂网络结构中十分普遍。大到万维网,小到蛋白质的作用网络,人们都能找到无标度网络的影子。更直观的讲,无标度网络中总是由少数节点连接着大部分的节点,呈现出一种“枢纽”效应,例如微博用户关系网络中只有少部分大V拥有极多粉丝,而大部分用户的粉丝却寥寥无几。
Fig.2 蛋白质作用中的无标度网络
来自美国东北大学的物理学家Albert-László Barabás是无标度网络理论的坚定支持者。他在《Linked》一书中阐述道,真实世界中幂律分布无处不在,对此的研究将有助于我们更深刻地把握复杂网络结构。直到今天,无标度网络和幂律分布的研究已经成为了网络科学学者绕不开的话题。
无标度理论的拥护者宣称,无标度网络这一概念的推广,有助于人们理解一些复杂的社会现象,比如黑客对网络结构的攻击策略。面对来自黑客的随机攻击时,随机网络结构会很快被分裂割断,形成大大小小的子块,而无标度网络则有较高概率维持连通性;然而面对协同攻击(或称蓄意攻击)时,黑客只需要选择性地攻击少数枢纽节点,就能迅速击溃无标度网络。
Barabási在书中写道:“令人惊讶的是,这些简单而深远的自然法则控制着我们周围复杂网络系统的结构和演变。探究这些定律像是一次美妙无比的过山车旅程,我们乘坐过山车在纷繁复杂的世界里穿行,领略不同角度带来的异样风景。”
无标度网络理论的支持者似乎坚信,幂律分布在现实复杂网络结构中存在普适性。但是很早就有学者针对这一信念提出质疑,认为该理论缺乏统计学意义上的严格性。不过这并没有妨碍无标度网络理论攀上经典宝座。
新的质疑
然而最近发布的一篇论文却再度引发了关于无标度网络的争论。论文作者Anna Broido和Aaron Clauset向无标度网络递上战书:“真实世界网络显示出丰富多样的结构,这可能需要新的理论模型来解释。” 他们在研究中对接近1,000个现实存在的网络系统进行了统计分析,这些网络系统涵盖广泛,分属生物、技术、社会科学等不同的领域。但令人意外的是,他们发现其中只有4%的系统能够通过幂律分布的强检验,而67%的系统都不服从幂律分布。这些不服从幂律分布的系统中,很多十分常见,比如说食物网、水资源供应网络、Facebook用户关系网络等。毫无疑问,无标度网络理论遭遇了自其问世以来的最大挑战。
Fig.3 Aaron Clauset
Fig.4 Anna Broido
Anna Broido和Aaron Clauset的研究成果迅速引爆了学界的争论。大部分学者都对统计结果表示认可,但是对于这些统计结果的理解阐释,仍然存在很大的分歧。围绕“如何解释统计值对幂律分布的偏离”这个问题,科学家们旗帜分明地分化成了两派。
无标度网络理论的拥护者Barabási解释说,无标度网络的形成机制是偏好连接机制,例如说:被引用较多的文献会进一步吸引更多的引用量;被粉丝关注较多的用户会更容易吸引粉丝。这是一种网络连接中的“马太效应”。Barabási认为,无标度网络不仅仅只受这一种连接机制的影响,一个复杂网络结构的诞生,其背后有着更为复杂的形成机制。而这种形成机制的复杂性会导致统计结果偏离幂律分布。此外,无标度网络理论的拥护者们还认为,现实世界中总是存在各式各样的干扰因素,这也会导致研究的统计结果发生偏离。
但是Clauset显然对这样的辩护不以为然。他直言,“接受过良好统计学训练的物理学家都不应该说出这样的话。”即便存在细微的影响,1000的样本量已经足以让我们做出初步的判断:如果幂律分布的确是复杂网络结构中的主导机制,那么它在统计结果中应该有相应的体现。
评论
这次的“无标度之争”实际上是物理理论和统计学正常磨合,毕竟很多理论的提出本身只是对现象的解释模仿,是一种对现象的“想象化拟合”。这也是科学创新的艺术性所在。人们尝试构建一个理论,能让我们在理解世界纷繁复杂的现象时找到秩序性。
另一位颇有影响的研究网络的科学家Duncan Watts认为,无标度性在一定程度上解释了某些现象,具有其自身的理论价值,但其适用范围可能还需要斟酌。常见的重尾(heavy-tailed)特征和无标度性也许不完全是一回事,因此用无标度性去套用是过于简单化了,正如科学家Alessandro Vespignani所说的:“到目前为止,网络科学还没有什么普适理论。”
点击“阅读原文 ”查看原文
扩展阅读
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方